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[摘要 ]: 本 文通 过 识别 和 区 分 实验 探讨 延边 朝鲜 族 学 生 对 普通 话 声调 的 范畴 感知 。 实 验 结 
显示 , 具有 较 高 朝 汉 双 语 程度 的 延边 朝鲜 族 大 学 生 对 普通 话 声 调 的 感知 接近 或 达到 了 母语 者 
的 水 平 。 除了 T2-T3 组 以 外 ,其 他 各 组 声调 对 立 的 感知 范畴 化 程度 和 母语 者 差异 不 大 。 母 语 
背景 和 较 高 的 双语 程度 可 能 是 延边 朝鲜 族 学 生 对 普通 话 声调 感知 接近 或 达到 母语 者 水 平 的 
制约 因素 ，T2-T3 的 低 范 畴 化 感知 水 平 与 前 人 对 不 同 母语 背景 普通 话 学 习 者 的 研究 结果 一 致 ， 
说 明 这 两 个 声调 在 语音 声学 特征 上 的 相似 性 可 能 导致 高 级 阶段 的 学 习 者 也 无 法 成 功 建立 接 


近 母 语 者 的 感知 模式 。 
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普通 话 声调 感知 的 研究 最 早 是 Wang (1976) 提出 的 ， 他 通过 实验 发 现 ， 母 语 者 对 阴平 
和 阳平 的 感知 是 范畴 感知 Ccategorical perception)， 即 连续 的 语音 变化 被 知觉 为 离散 的 、 数 
量 有 限 的 范畴 ， 两 个 声调 间 存 在 明确 的 感知 边界 。 随 后 ， 更 多 研究 表明 ， 母 语 者 对 普通 话 阴 
平和 阳平 、 阴 平和 去 声 、 阳 平和 去 声 、 上 声 和 去 声 之 间 的 声调 感知 是 范畴 感知 (Xu et al. 2006; 


Peng et al. 2010;28 4 2013; 于 谦 2016 等 ); 然而 ， 对 普通 话 阳 平和 上 声 之 间 的 感知 模式 是 否 


是 范畴 感知 则 存在 争议 〈 杨 若 晓 2009; E Hi FE 2010:Chen A2013; 于 谦 2016). 
近 十 几 年 来 ， 对 非 普通 话 母 语 者 的 声调 感知 研究 逐渐 增多 ， 普 通话 声调 也 是 非 母 语 者 


(L2) 学 习 过 程 中 的 较 难 掌握 的 语音 特征 。 根 据 知觉 同化 模型 (Perceptual Assimilation Model, 


PAM) (Best, C. T. 1995) 和 言语 学 习 模 型 (Speech Learning Model, SLM) (Flege, J. E. 1992、 
1999), L2 学 习 者 的 母语 背景 、 学 习 时 长 和 语言 环境 都 影响 他 们 对 普通 话 声 调 的 感知 ， 特 别 
是 学 习 者 母语 中 是 否 存在 声调 以 及 声调 分 布 的 特征 。 如 果 L2 学 习 者 的 母语 中 不 存在 声调 系 
统 ， 则 他 们 很 难 感知 普通 话 的 声调 ， 如 研究 发 现 英语 、 法 语 等 非 声调 语言 母语 者 不 能 够 建立 


起 跟 母 语 者 相同 的 声调 范畴 感知 (Wang 1976; Hallé et al. 2004; Xu et al. 2006; Peng et al. 
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2010). 声调 语言 背景 母语 者 感知 普通 话 声调 则 存在 差异 化 的 表现 。 如 于 谦 (2016) 等 发 现 ， 
汉语 方言 母语 者 感知 普通 话 声调 时 能 够 建立 起 类 似 母 语 者 的 范畴 感知 , 但 受到 方言 的 影响 也 
呈现 出 一 些 特 点 。Hao(2012 ) 发 现 , 粤语 母语 学 习 者 很 难 区 分 普通 话 阴 平和 去 声 。 So(2005 ) 
发 现 日 语 母语 学 习 者 识别 普通 话 阳 平和 去 声 要 比 阴 平和 上 声 容 易 。 然 而 ， 张 林 军 (2010) 认 为 
日 语 的 音 高 横 式 对 零 起 点 的 日 本 学 习 者 对 普通 话 声调 的 范畴 化 知觉 没有 本 质 影响 。 
Minagawa-Kawai (2005) 认为 第 二 语言 语音 范畴 感知 的 能 力 存 在 一 个 不 断 发 展 的 过 程 ， 
某 些 音 段 特征 在 经 过 一 段 时 间 的 学 习 后 ,可 以 建立 起 与 母语 者 类 似 的 范畴 感知 。 普 通话 的 学 
习 经 历 对 提高 普通 话 声 调 范畴 感知 程度 的 重要 性 也 为 以 往 大 量 的 研究 所 证 实 。 然 而 ，L2 学 
习 者 是 否 能 够 达到 接近 或 与 母语 者 相同 的 声调 感知 模式 则 较 少 有 报告 。 王 丰 佳 (2011) 等 发 
现 , 母语 为 韩国 语 的 普通 话 高 级 学 习 者 对 普通 话 声调 的 感知 模式 与 母语 者 较为 接近 , 但 在 


> 些 方面 仍然 与 后 者 存在 差异 ， 主 要 表现 在 对 阳平 和 上 声 混 消 。 张 林 军 (2010) 认为 ， 较 高 水 
N 平 的 日 本 学 习 者 普通 话 声调 的 范畴 感知 程度 可 能 接近 母语 者 的 水 平 ， 但 精细 化 程度 
= (fine-grain sensory encoding ability) 仍 有 竺 提高。Wang (2013) 发 现 学 习 训 练 能 够 有 效 提 
- mA RS OA CAI. SEAS) 对 普通 话 声调 的 感知 。 安 乐 (2005)、 何 江 
oo (2011)、 刘 亚 丽 (2013) 等 发 现 ， 新 疆 地 区 维吾尔 族 学 生 对 普通 话 声调 的 感知 具有 “ 半 范 
= BETERI” FFA. (E fe Te LET FE TR FS Fo YE BS EE 2 VO EL FS PE HE 

pt 本 文 讨论 中 国 延边 朝鲜 族 学 生 的 汉语 普通 话 声调 的 范畴 感知 ,以 延边 朝鲜 族 学 生 作为 研 


究 对 象 有 特殊 的 意义 。 首先 ， 延边 朝鲜 族 学 生 的 母语 语音 系统 与 韩国 语 存在 一 些 差 异 。 朝鲜 
语 方言 根据 音节 是 否 具有 音 高 重音 (accent) 分 为 两 组 ， 成 镜 道 和 庆 尚 道 方言 被 认为 是 音调 
语言 (tonal)， 其 他 方言 〈 例 如 中 部 方言 ) 则 是 非 声调 语言 (non-tonal)。 延 边 朝鲜 语 的 音调 
系统 与 成 镜 〈 北 ) 道 方言 非常 接近 ， 这 与 中 国 朝鲜 族 的 移民 历史 有 关 。 延 边 朝鲜 语 从 本 质 来 


说 音 高 重音 语言 (pitch accent language)， 在 词汇 层面 存在 高 调 (High) PRY (Low) 的 纪 


fo 


合 ， 每 个 词汇 存在 至 多 一 个 音 高 重音 〈accent)， 在 声学 上 表现 为 基 频 高 点 (pitch peak); 


音 音节 外 的 其 他 音节 全 部 为 低调 。 在 双 / 多 音节 词语 中 ， 重 音 音节 位 于 词语 右 侧 两 个 音节 中 


mh 
Ian 


的 一 个 , 朝鲜 语 本 土 词汇 多 为 尾 重音 类 型 (final accent class), 例如 “gj 可 器 ( 妈妈 Y [d.ma.ni] 


(CO RRL, V RIRH); 音节 重量 (syllable weight) 影响 重音 位 置 ， 如 果 倒 数 第 二 个 音 


节 是 重音 节 (heavy syllable), 则 可 以 产生 倒数 第 二 音节 重音 类 型 (penultimate accent class), 


iio “FEH ( SHY [ke:dzuirak ts*i] (Ito 2008, 2014;Ito, Kenstowics 2009)。 延 边 朝 鲜 


语 的 音调 特征 与 韩国 标准 语 存在 较 大 差异 , 前 者 的 音调 是 词汇 的 固有 音 系 特征 , 而 韩国 标准 


语词 汇 的 音调 则 受到 韵律 短语 〈 即 音 高 重音 短语 ，accentual phrase) 的 制约 (Jun, 2005). Al 
此 , 本 文 的 研究 结果 可 以 与 韩国 语 母语 者 的 汉语 声调 感知 结果 进行 比较 ， 从 而 可 以 讨论 相同 
母语 条 件 ， 不 同音 调 类 型 的 方言 学 习 者 的 汉语 声调 感知 是 否 存在 差异 。 

其 次 ， 延 边 朝鲜 族 学 生 具 有 较 高 的 朝 、 汉 双语 程度 。 延 边 当地 完善 的 双语 教学 模式 和 充 
分 的 双语 使 用 社会 文化 环境 对 朝鲜 族 学 生 双 语 能 力 的 形成 具有 重要 的 作用 。 大 多 数 朝鲜 族 学 
都 表现 为 接近 于 平衡 的 双语 者 。 因 此 ,延边 朝鲜 族 学 生 有 可 能 在 汉语 声调 感知 上 接近 汉语 
母语 者 。 金 哲 俊 (2014) 对 延边 朝鲜 族 学 生 的 汉语 声调 产 出 进行 了 系统 的 分 析 。 他 发 现 朝鲜 
族 学 生 基 本 上 能 够 产 出 汉语 的 四 个 声调 ， 但 是 声调 调 值 不 稳定 ， 同 时 存在 较 大 的 个 体 差 异 。 
然而 ， 朝 鲜 族 学 生 对 普通 话 声调 感知 是 否 存 在 范畴 目前 并 没有 报告 。 

最 后 , 中 国 朝鲜 语 社区 在 长 期 的 朝 汉 语言 接触 过 程 中 引入 了 大 量 的 汉语 借词 loanword ), 
这 些 借词 的 音调 模式 与 汉语 来 源 词 的 声调 模式 存在 相对 严整 的 对 应 形式 (朝鲜 语 借词 和 中 世 
纪 的 朝鲜 语 的 汉 源 词 是 两 类 不 同 的 词汇 ， 且 语音 本 土 化 的 机 制 也 存在 差异 ) (Ito 2014)。 如 
果 借 词 最 后 一 个 音节 为 阴平 或 去 声 、 或 者 倒数 第 二 个 音节 为 上 声 的 时 候 表 现 为 尾 重音 模式 
(Ito 2014)， 这 与 汉语 来 源 词 最 后 一 个 音节 和 倒数 第 二 个 音节 间 基 频 曲 线 的 上 升 密切 相关 。 
汉语 来 源 词 在 其 他 声调 组 合 条 件 下 , 由 于 倒数 第 二 音节 和 最 后 音节 间 的 基 频 曲线 表现 为 下 降 
的 趋势 ， 朝 鲜 语 借词 表现 为 倒数 第 二 音节 重音 类 型 。 由 此 可 以 看 出 ,延边 朝鲜 族群 体 对 普通 
话音 节 声调 音 高 高 点 《如 阴平 和 去 声 的 起 点 音 高 较 高 ， 上 声 较 低 ) 比较 敏感 ， 对 音节 间 声 调 
音 高 变化 也 比较 敏感 , 由 此 可 以 假设 延边 朝鲜 族群 体 对 于 汉语 声调 的 高 低 ( 例 如 阴平 和 上 声 ) 
以 及 声调 的 升降 (阳平 和 去 声 ) 具有 一 定 的 感知 优势 。 

本 文采 用 感知 实验 的 识别 (identification〉 和 区 分 (discrimination〉 任 务 进行 研究 。 范 
畴 感知 的 判定 标准 为 “识别 曲线 存在 陡峭 范畴 边界 ， 同 时 区 分 曲线 在 识别 边界 存在 波峰 ” 
(Liberman et al. 1957; Studdert-Kennedy et al. 1970;Xu et al. 2006; 于 谦 2016)。 不 过 ， 也 有 学 
者 对 该 标准 存在 争议 并 提出 了 “ 准 范畴 感知 “范畴 感知 梯度 "等 概念 (Schouten &van Hessen 


1992; Hallé et al. 2004; 杨 若 晓 2009)。 范 畴 化 程度 公认 的 量化 指标 是 “识别 宽度 (width of 


Ly 


identification)” 55 “[X4}I4—E” (peakedness of discrimination,DP) (Xu et al. 2006; Jiang, 
Hamm,Lim, Kirk & Yang 2012). 

本 文 将 综合 使 用 上 述 研究 范式 以 及 量化 指标 体系 来 分 析 延 边 朝 鲜 语 母语 者 对 汉语 普 ; 
话 四 个 声调 的 感知 特点 。 最 后 与 普通 话 母 语 者 的 感知 结果 ,以 及 本 文 作者 正在 进行 中 的 中 
其 他 少数 民族 母语 背景 的 普通 话 声调 感知 研究 进行 对 比分 析 , 从 而 探讨 普通 话 声调 感知 机 种 


及 母语 经 验 的 影响 。 
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二 、 实 验方 法 
2.1 实验 被 试 
实验 被 试 为 34 名 延边 朝鲜 语 母语 者 〈15 男 ，19 女 )， 均 为 延边 大 学 外 国语 学 院 一 年 级 
到 三 年 级 本 科 生 ， 年 龄 和 所 受 教育 程度 相当 。 所 有 被 试听 力 正 常 ， 从 小 在 朝鲜 族 学 校 接受 汉 
语 、 朝 鲜 语 双语 教育 ， 高 考 用 朝鲜 语 答卷 在 大 学 公共 课 听课 和 考试 主要 使 用 汉语 。 平 时 与 


家 人 、 朋 友 说 朝鲜 语 为 主 。 普 通话 对 照 组 共 25 人 (10 男 , 15 女 ), 均 为 土生 土 长 的 北京 人 ， 
普通 话 水 平 在 二 级 乙 等 以 上 。 
2.2 实验 刺激 


实验 中 所 采用 的 刺激 样本 由 四 个 真实 的 汉语 普通 话 单字 调 音 节 合 成 :“ 搭 ”“ 达 ”“ 打 ”、 
“大 ”这 四 个 音节 声韵 母 相同 , 声调 分 别 为 阴平 、 阳 平 、 上 声 、 去 声 (下 文 称 为 ″”T1、T2、 
T3、T4”)。 原 始 音 节 由 一 位 女性 国家 级 普通 话 测试 员 发 声 ， 每 个 音节 平均 时 长 500ms。 录 音 
在 安静 的 室内 进行 ,设备 包括 :cool edit 录音 软件 、 麦 克 风 (Sony)、 笔 记 本 电脑 (Thinkpad)、 
外 置 声卡 和 调 音 台 。 录音 时 的 采样 频率 为 22050Hz， 采样 精度 为 16 位 。4 个 声调 对 立 形式 共 
6 种 : T1-T2, T1-T3, T1-T4, T2-T3, T2-T4, T3-T4. 我 们 在 合成 样本 时 通过 PSOLA ( 基 
MASI) 的 方法 均匀 改变 基 频 ， 对 每 组 声调 对 立 ， 以 T1-T2 组 为 例 ， 我 们 会 以 T1 ABE 
本 不 断 改 变 基 频 至 T2 合成 一 组 刺激 ， 也 会 以 T2 为 母 本 改变 基 频 至 T1 合成 一 组 刺激 ， 两 组 
合成 所 用 的 基 频 序列 完全 相同 ， 但 各 自 保 留 了 不 同 母 本 的 发 声 类 型 。 最 终 合成 了 12 组， 每 
组 11 个 ， 共 计 132 个 刺激 样本 。 
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图 2: 不 同 声调 合成 样本 设计 
图 2 左 图 为 T1-T2 的 合成 样本 , 基 频 最 低 为 172. 72Hz, 最 高 为 297. 58 Hz, 中 图 为 T1-T3 
的 合成 样本 ， 基 频 最 低 为 126. 65 Hz， 最 高 为 294. 91 Hz， 右 图 为 T1-T4 的 合成 样本 ， 基 频 


最 低 为 102. 58 Hz， 最 高 为 316. 92 Hz。 
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T2-T3 T2-T4 T3-T4 


300 320 320 
280 300 300 
260 280 380 
240 260 260 
220 240 520 
200 220 500 
180 200 180 
1 180 160 
140 160 140 
120 140 120 
100 120 100 
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图 3: 不 同 声调 合成 样本 设计 

图 3 左 图 为 T2-T3 的 合成 样本 , 基 频 最 低 为 111. 99 Hz, 最 高 为 297. 58 Hz, 中 图 为 T2-T4 
的 合成 样本 ， 基 频 最 低 为 122. 08 Hz， 最 高 为 302. 5 Hz， 右 图 为 T3-T4 的 合成 样本 ， 基 频 最 
低 为 113. 49 Hz， 最 高 为 303. 89 Hz. 

2.3 实验 过 程 

每 个 被 试 先 完成 识别 实验 ， 再 完成 区 分 实验 。 正 式 实验 开始 前 有 练习 环节 ， 确 保 被 试 理 
解 实 验 任务 并 熟悉 按键 。 实 验 中 间 ， 被 试 可 随时 按 下 暂停 键 进 行 休息 。 所 有 的 刺激 由 索尼 
MDR-7506 耳机 播放 出 来 ， 双 声 道 ，72dB SPL。 实 验 和 数据 采集 使 用 E-PRIME 软件 进行 。 

(1) 识别 实验 : 

在 识别 实验 中 ，12 组 刺激 随机 播放 ， 每 组 的 11 个 刺激 各 随机 出 现 2 Ve (2*11=22), 
次 每 个 刺激 连续 播放 2 遍 。 声 音 播放 的 同时 屏幕 上 会 同时 出 现 “ 搭 ”“ 达 ”“ 打 ”“ 大 ”中 
的 任意 两 个 字 , 播放 完毕 后 , 被 试 必须 在 5 秒 的 时 间 内 通过 键盘 上 的 “一 ”和 “一 ”按键 判 
断 这 个 语音 是 屏幕 上 哪个 字 。 

(2) 区 分 实验 : 

采用 AX 型 区 分 实验 ， 即 每 个 刺激 间隔 500 毫秒 成 对 出 现 (Pisoni DB. 1973)， 要 求 被 
试 判断 这 个 样本 对 是 “相同 ”还 是 “不 同 ”。 在 每 组 刺激 中 , 不 同 对 中 的 两 个 刺激 间隔 两 个 
步 长 ， 正 序 和 倒序 都 要 播放 ，12 组 刺激 共 组 成 了 18*12+9%12=324 个 样本 对 。 每 个 样本 对 会 
在 实验 中 播放 2 次 ， 所 有 样本 对 的 播放 是 随机 的 。 被 试 在 听 到 一 个 样本 对 之 后 ， 需 要 在 5 
秒 内 通过 “一 ”和 “一 ”按键 判断 它们 “相同 ”还 是 “不 同 ”, 5 秒 后 下 一 组 刺激 对 将 自动 
出 现 ， 或 者 被 试 做 出 选择 后 下 一 组 刺激 对 也 将 自动 出 现 。 

2.4 数据 分 析 

本 文 统计 了 被 试 的 “识别 边界 、 识 别 宽度 、 区 分 率 及 区 分 峰 度 ”， 并 对 母语 被 试 和 朝鲜 
语 被 试 的 范畴 化 程度 进行 了 对 比 。 数 据 统计 采用 Exce12010 和 IBM SPSS 20. 0 进行 。 

(1) 识别 边界 与 识别 宽度 

每 个 刺激 的 识别 结果 是 被 试 将 其 识别 为 “一 ”和 “一 ”选项 的 百分比 。 根 据 识 别 实验 数据 ， 


我 们 构造 了 二 分 变量 逻辑 回归 模型 (Binary logistic regression): log (PL/1-P1) =b0+b1x (Xuet 
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al, 2006)， 其 中 P1 为 每 个 刺激 的 识别 结果 ，x 为 声音 连续 体 的 步 长 个 数 ，b0 和 bl 是 回归 模 
型 函数 中 自 变量 x 的 回归 系数 和 常数 ,识别 率 为 0.5 时 所 对 应 的 x 值 即 为 识别 边界 :Xcb= -b0/ 
bl1， 识 别 宽度 C(Wcb) 则 为 识别 率 为 25% 和 75% 之 间 的 线性 距离 。Wcb 越 窄 ， 在 边界 附近 
从 一 个 音 位 范畴 到 另 一 个 音 位 范畴 变化 的 速率 越 快 ， 范 畴 化 程度 越 高 。 

(2) 区 分 率 与 区 分 峰 度 

区 分 率 采 用 公式 P=P(“S”|S)*P(S)+P(“D”|D)*P(D) 计算 (Xu et al, 2006)。 其 中 P(“S”|S) 
为 相同 样本 对 被 判断 为 相同 的 概率 , P(“D”|D) 为 不 同样 本 对 被 判断 为 不 同 的 概率 , PSA PCD) 
是 相同 样本 对 和 不 同样 本 对 在 整个 区 分 实验 中 的 比例 , 本 次 实验 PCS) 和 PCD) 分 为 13 和 2/3。 
对 于 每 个 被 试 而 言 ， 范 畴 间 区 分 率 〈 下 文 简称 Pbc) 为 跨 过 该 识别 边界 位 置 的 两 对 样本 对 的 
区 分 率 平均 值 , 范畴 内 区 分 率 ( 下 文 简称 Pwo ) 为 其 余 各 组 的 区 分 率 平 均值 (Jiang, Hamm,Lim, 
Kirk & Yang 2012;Chen Peng Yan & Wang 2016)。 区 分 曲线 的 峰 度 〈 下 文 简 称 Ppk) 由 范畴 间 
区 分 率 和 范畴 内 区 分 率 的 差 值 决定 。 峰 度 越 高 ， 被 试 对 范畴 间 (between category) 语音 差异 
比 对 范畴 内 〈within category) 语音 差异 的 感知 越 为 敏感 ， 范 畴 化 程度 越 高 。。 

三 、 实 验 结果 与 分 析 


3.1 识别 曲线 与 区 分 曲线 
图 4 为 T1-T2 声调 连续 统 感知 结果 。 两 组 被 试 的 识别 曲线 在 交点 边界 附近 均 呈 现 相 对 陡 
峭 的 上 升 或 下 降 ， 区 分 曲线 在 边界 位 置 附近 有 明显 凸 起 的 区 分 波峰 。 


T1-T2 (TIẸ) 汉 T1-T2 〈(T1 母 本 ) HA T1-T2 (T2EEA) 汉 T1-T2 (T2EEA) 朝 
100% 100% 100% 100% 
80% 80% 80% 80% 
60% 60% 60% 60% 
40% 40% 40% 40% 
20% 20% 20% 20% 
0% 0% 0% 0% 

1234567 891011 1234567 891011 1234567 891011 1234567 891011 
* 实 测 区 分 率 - 搭 " 达 H : 达 实测 区 分 率 :实测 区 分 率 : 达 H * 达 fF :实测 区 分 率 


4: T1-12 声调 连续 统 感知 结果 
图 5 为 T1-T3 声调 连续 统 感知 结果 。 两 组 被 试 的 识别 曲线 在 交点 边界 附近 均 呈 现 相对 陡 
峭 的 上 升 或 下 降 ,， 区 分 曲线 在 边界 位 置 附近 有 一 个 凸 起 的 区 分 波峰 ,但 是 波峰 较为 平缓 ， 朝 
鲜 语 被 试 的 区 分 波峰 较 母 语 被 试 更 为 明显 。 


T1-T3 (TIZ) 汉 T1-T3 〈T1 母 本 ) 朝 T1-T3 〈T3 母 本 ) 汉 T1-T3 〈T3 母 本 ) 朝 
100% 100% 100% 100% 
80% 80% 80% 80% 
60% 60% 60% 60% 
40% 40% 40% 40% 
20% 20% 20% 20% 
0% 0% 0% 0% 

1234567 891011 1234567 891011 1234567 891011 1234567 891011 
* 实 测 区 分 率 - 搭 AT H FT * 实 测 区 分 率 * 实 测 区 分 率 : 打 -H FT HE :实测 区 分 率 


5: T1-T3 声调 连续 统 感 知 结果 
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图 6 为 T1-T4 声调 连续 统 感知 结果 。 两 组 被 试 的 识别 曲线 在 交点 边界 附近 均 呈 现 相 对 陡 
峭 的 上 升 或 下 降 ， 区 分 曲线 在 边界 位 置 附近 有 明显 凸 起 的 区 分 波峰 。 


T1-T4 (T1 母 本 ) WM T1-T4 (T1 母 本 ) 朝 T1-T4 〈T4 母 本 ) 汉 T1-T4 (T4 母 本 ) 朝 
100% 100% 100% 100% 
80% 80% 80% 80% 
60% 60% 60% 60% 
40% 40% 40% 40% 
20% 20% 20% 20% 
0% 0% 0% 0% 

1234567 891011 1234567 891011 1234567 891011 1234567 891011 
:实测 区 分 率 HR :大 H :大 -实测 区 分 率 :实测 区 分 率 :大 H :大 : 搭 :实测 区 分 率 


图 6: Tl-T4 声调 连续 统 感知 结果 
图 7 为 T2-T3 声调 连续 统 感知 结果 。 两 组 被 试 的 识别 曲线 在 交点 边界 附近 均 呈 现 相对 陡 
峭 的 上 升 或 下 降 ， 母语 被 试 的 区 分 曲线 的 波峰 不 太 明 显 , 而 朝鲜 语 被 试 的 区 分 曲线 观测 不 到 
波峰 ， 几 乎 为 40% 左 右 的 一 条 直线 。 


T2-T3 〈T2 母 本 ) W T2-T3 (T2 母 本 ) 朝 T2-T3 〈T3 母 本 ) W T2-T3 (T3 母 本 ) 朝 
100% 100% 100% 100% 
80% 80% 80% 80% 
60% 60% 60% 60% 
40% 40% 40% 40% 
20% 20% 20% 20% 
0% 0% 0% 0% 
1234567 891011 1234567 891011 1234567 891011 1234567 8 91011 


Al 7: T2-T3 声调 连续 统 感知 结果 
图 8 为 T2-T4 声调 连续 统 感知 结果 。 两 组 被 试 的 识别 曲线 在 交点 边界 附近 均 呈 现 相 对 陡 
峭 的 上 升 或 下 降 ， 两 组 被 试 的 区 分 曲线 都 呈现 一 个 典型 的 平台 状 波峰 。 


T2-T4 〈T2 母 本 ) 汉 T2-T4 (T2 母 本 ) 朝 T2-T4 〈T4 母 本 ) 汉 T2-T4 (T4 母 本 ) 朝 
100% 100% 100% 100% 
80% 80% 80% 80% 
60% 60% 60% 60% 
40% 40% 40% 40% 
20% 20% 20% 20% 
0% 0% 0% 0% 

1234567 891011 1234567 891011 1234567 891011 1234567 891011 
* 实 测 区 分 率 - 达 "大 " 达 :大 * 实 测 区 分 率 * 实 测 区 分 率 :大 IK :大 " 达 :实测 区 分 率 


图 8: T2-T4 声调 连续 统 感知 结果 
图 9 为 T3-T4 声调 连续 统 感知 结果 。 两 组 被 试 的 识别 曲线 在 交点 附近 均 呈 现 相 对 陡峭 的 
上 升 或 下 降 ， 母 本 为 T3 时 ， 区 分 曲线 有 一 个 明显 的 波峰 ， 母 本 为 T4 时 ， 虽然 可 以 观察 到 波 
峰 ， 但 是 波峰 稍 显 平缓 ， 并 且 略 偏离 识别 边界 。 


T3-T4 (T3EEA) 汉 T3-T4 (T3 母 本 ) 朝 T3-T4 (TAZ) 汉 T3-T4 (T4 母 本 ) 朝 
100% 100% 100% 100% 
80% 80% 80% 80% 
60% 60% 60% 60% 
40% 40% 40% 40% 
20% 20% 20% 20% 
0% 0% 0% 0% 

1234567 891011 1234567 891011 1234567 891011 1234567 891011 
* 实 测 区 分 率 FT "大 fT :大 -实测 区 分 率 :实测 区 分 率 :大 AT :大 FT :实测 区 分 率 


图 9: T3-T4 声调 连续 统 感知 结果 
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3. 2 识别 边界 与 识别 宽度 

通过 回归 统计 得 到 的 两 组 被 试 的 总 边界 位 置 和 边界 宽度 如 表 1 所 示 。 对 于 每 组 声调 对 立 ， 
合成 母 本 不 同 , 母语 被 试 、 朝 鲜 语 被 试 的 Xcb、Wcb 都 略 有 差异 , 但 重复 测量 方差 分 析 显 示 ， 
仅 有 T3-T4 组， 母语 被 试 和 朝鲜 语 被 试 对 不 同 母 本 合成 的 刺激 连续 统 识别 结果 差异 显著 〈F 
(1, 1094)=23. 127, p<0. 005;F(1,742)=38. 25, p<0. 005) , 其 他 各 组 差异 均 不 显著 (p>0. 005)。 
近期 有 研究 指出 ， 发 声 类 型 对 声调 的 感知 也 有 一 定 的 辅助 作用 《〈 杨 若 晓 ，2009; SELES FL 
江平 ，2014)， 不 过 这 不 是 本 文 的 研究 问题 ， 因 此 在 这 里 不 做 讨论 ， 暂 将 各 组 内 部 的 两 套数 


据 平均 计算 。 
表 1: 朝鲜 语 被 试 、 普 通话 被 试 识别 边界 、 识 别 宽度 
声调 对 立 合成 母 本 Xcb Xcb Web Web 
普通 话 被 试 朝鲜 语 被 试 普通 话 被 试 朝鲜 语 被 试 

T1-T2 T1 3. 66 3. 92 0.89 1.54 
3.95 4.11 1.14 1.46 

T2 4. 24 4.31 1.39 1.38 

T1-T3 T1 5.12 4. 66 1.83 1.43 
5. 08 4.61 1.66 1.40 

T3 5. 04 4. 56 1.48 1.38 

T1-T4 T1 3.6 3. 23 0.85 1.40 
3.57 3.41 0.88 1.41 

T4 3. 54 3. 58 0.91 1.41 

T2-T3 T2 7. 38 6. 80 1.61 2.74 
7. 30 6.77 1.88 2.76 

T3 7.21 6. 74 2.15 2.78 

T2-T4 T2 5. 74 5. 49 1. 12 1.33 
5. 67 5. 53 0.95 1.18 

T4 5.6 5. 57 0. 78 1.03 

T3-T4 T3 4. 64 4. 88 1. 08 1.52 
5.13 5. 40 1.83 1.37 

T4 5. 61 5.91 2.57 1.22 


从 Xcb 来 看 ， 朝 鲜 语 被 试 感知 TI1-T2、T3-T4 组 的 Xcb 比 母 语 被 试 略为 后 移 ， 感 知 其 他 
各 组 声调 连续 统 的 xcb 比 母语 被 试 略 为 前 移 ,但 单 因素 方差 分 析 均 不 存在 显著 差异 (p>0.005)。 
假设 当 T1-T2 的 Xcb 为 4 时 ， 我们 即 定 义 Tl 的 Xcb 为 4，T2 为 7， 如 此 计算 得 出 ， 朝 鲜 语 被 
试 四 声 范畴 均值 分 别 为 : 4. 04 、6. 40 、5. 34 、6. 22。 母 语 被 试 分 别 为 : 4. 04 、6. 58 、 
5.09 、6. 21。 朝 鲜 语 被 试 与 母语 被 试 的 四 声 范畴 均值 极为 接近 。 

从 Web 来 看 ， 朝 鲜 语 被 试 感知 T2-T3 组 的 Web 最 宽 ， 感 知 T2-T4 组 的 Web 最 窗 。 而 母 
语 被 试 感知 T2-T3 组 的 Web 最 宽 ， 感 知 T1-T4 组 的 Web 最 窗 。 与 母语 被 试 对 比 ， 朝 鲜 语 被 
试 感知 T1-T3 和 T3-T4 组 的 Web 略 小 于 母语 被 试 ， 感 知 其 他 各 组 声调 连续 统 的 Web 均 略 大 
于 母语 被 试 。 不 过 , 朝鲜 语 被 试 与 母语 被 试 的 Web 差异 , 从 数值 上 来 看 , 除了 T2-T3 组 之 外 ， 
均 未 超过 0. 5。 

3.3 区 分 率 与 区 分 峰 度 
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两 组 被 试 的 范畴 间 、 范 畴 内 区 分 率 以 及 区 分 峰 度 如 图 10 所 示 。 
从 两 组 被 试 各自 的 情况 来 看 ， 经 过 单 因 素 方差 分 析 ， 母 语 被 试 感知 各 组 声调 对 立 的 Pbc 
均 显 著 大 于 Pwc (p< 0.005)，T1-T2 组 的 Ppk 最 高 (40.00%、33.48 多 )。 朝 鲜 语 被 试 感知 


T2-T3 组 的 Pbc(38.48%、41.91%) 和 Pwc(37.04%、37.46% ) 差异 不 显著 (p=0.17; p=0.006), 
感知 其 他 各 组 声调 对 立 的 Pbc 均 显著 高 于 Pwc (p < 0.005), T1-T2 组 的 Ppk 最 高 (35.92%, 
30.74% )。 

两 组 被 试 对比 来 看 ， 朝 鲜 语 被 试 的 Pbc、Pwec 均 小 于 母语 被 试 ， 不 过 这 种 差异 经 单 因 素 
方差 分 析 不 显著 〈(p>0.005)。 朝 鲜 语 被 试 感知 T1-T3 组 的 Ppk 略 大 于 母语 被 试 ， 感 知 其 他 各 
组 声调 对 立 的 Ppk 略 小 于 母语 被 试 ， 不 过 经 单 因素 方差 分 析 差 异同 样 不 显著 (p>0.005 )。 


朝鲜 语 被 试 、 普 通话 被 试 区 分 率 

100% 
aor = 普通 话 被 试 Pbe 
60% = 普通 话 被 试 Prc 
40% hg = 普 通话 被 试 Ppk 
6 朝鲜 语 被 试 Pbe 
ate IL -gena Pwe 
0% = 朝鲜 语 被 坛 Ppk 


图 10: 朝鲜 语 被 试 、 普 通话 被 试 范畴 间 区 分 率 、 范 畴 内 区 分 率 、 区 分 峰 度 
四 、 讨 论 

实验 结果 表明 ， 对 比 “Xcb、Wcb 和 Ppk” 这 3 个 指标 ， 朝 鲜 族 学 生 整 体 上 已 经 建立 起 
了 接近 或 达到 母语 者 的 普通 话 声调 感知 模式 。 各 组 声调 连续 统 的 Xcb 及 整体 四 声 范 畴 均值 都 

与 母语 者 接近 ,除了 T2-T3 组 ,被 试 对 其 他 各 组 声调 的 Web 和 Ppk 与 母语 者 差异 也 都 不 显著 。 
虽然 朝鲜 语 被 试 的 Pbc 和 Pwc 均 小 于 母语 被 试 , 但 差异 并 不 显著 , Pbc 的 降低 意味 着 范畴 间 
区 分 能 力 的 弱化 ， 但 Pwe 的 降低 意味 着 范畴 内 刺激 敏感 程度 的 提高 些 刺激 属于 
同一 范畴 ， 所 以 不 需要 过 多 注意 细节 GKIRE 2010)。 这 一 结果 说 明 ， 某 些 刺激 尽管 被 归 入 
同一 声调 范畴 , 但 朝鲜 语 母 语 者 已 经 可 以 像 母 语 者 一 样 很 容易 去 忽略 它们 之 间 物 理 属性 的 差 
异 ， 也 就 是 说 ， 在 声调 范畴 化 的 精细 化 能 力 上 ， 朝 鲜 语 被 试 也 几乎 能 够 达到 母语 者 的 水 平 。 
对 比 检 验 感知 范畴 化 程度 的 *"Wcb” 和 "“Pplk”， 朝 鲜 语 被 试 的 数据 中 Web E HY T2-T4 
声调 连续 统 ，Ppk 最 高 的 则 为 T1-T2 声调 连续 统 ， 而 两 项 指标 均 略 优 于 普通 话 母语 者 的 是 
T1-T3 组 的 感知 结果 。 这 可 以 在 一 定 程 度 上 证 明 ， 我 们 在 引言 中 对 延边 朝鲜 族群 体 对 声调 的 


AR (T1 和 T3) 以 及 声调 的 升降 〈T2 和 T4) 具有 一 定 感知 优势 的 推测 。 


朝鲜 语 被 试 对 T2-T3 声调 连续 统 的 感知 范畴 化 程度 远 低 于 母语 被 试 ， 虽 然 识别 曲线 仍 
然 较为 陡峭 ,但 Web 显著 大 于 母语 被 试 ，Ppk 几乎 不 存在 ， 区 分 曲线 几乎 是 一 条 直线 。 这 与 
T2 和 T3 调 同时 都 存在 “ 先 降 后 升 ”的 特征 ， 调 型 较为 相似 有 关 。 在 以 往 的 研究 中 ， 普 通话 
母语 者 的 听 感 中 最 容易 相 混 的 就 是 阳平 和 上 声 , 对 不 同 母语 背景 学 习 者 来 说 更 是 感知 与 习 得 


的 难点 ， 如 王 档 佳 等 (2011) 发 现 ， 圩 国 高 级 学 习 者 对 T2 T3 调 的 感知 未 能 建立 起 接近 母 
语 者 的 感知 模式 。 金 哲 俊 (2014) 进行 的 朝鲜 族 学 生 汉 语 单 音 字 声 调 发 音 的 统计 ， 也 可 以 明 
显 看 出 学 生发 音 的 T2 和 T3 调调 型 非常 相似 , 均 为 先 降 后 升 。 本 文 的 数据 证 明 , 语音 的 相似 
度 是 学 习 T2 和 7T3 的 难点 问题 , 高 级 阶段 学 习 者 即使 能 对 普通 话 声调 其 他 各 组 声调 对 六 建 并 


起 接近 母语 者 的 感知 模式 ， 对 T2-T3 的 感知 范畴 化 程度 仍然 很 低 。 


朝鲜 族 学 生 对 普通 话 其 他 声调 对 立 较 高 的 感知 范畴 化 水 平 可 能 是 由 于 延边 朝鲜 语 的 母 


语 经 验 与 语言 环境 共同 导致 的 。 前 文 提 到 ,延边 朝鲜 语 在 词汇 层面 存在 音 高 重音 ， 汉 借词 也 


与 普通 话 声调 有 着 密切 的 关系 。 音 高 信息 在 不 同 语言 中 的 地 位 和 作用 决定 了 不 同 母 语 者 对 音 


高 信息 的 敏感 程度 存在 差异 (Luo 2007)， 比 如 ， 有 研究 发 现 汉 语 等 声调 语言 中 拥有 “绝对 音 


高 ”(absolute pitcm) 能 力 的 人 要 高 于 非 声调 语言 ， 因 为 声调 语言 的 经 验 提 高 了 对 音 高 信息 的 


[可 
感知 能 力 (Deutsch et al. 2006)。 前 人 研究 中 母语 为 英语 、 韩 语 、 维 普尔 语 等 语言 的 人 没有 任 


何 声 调和 音 高 重音 的 经 验 , 因此 对 声调 的 感知 只 能 是 基于 声调 之 间 物 理 属性 的 差异 ， 很 难 建 


立 起 与 普通 话 母 语 者 相同 的 声调 感知 模式 。 张 林 军 (2010) 认为 日 语 的 音 高 模式 对 普通 话 声调 
的 范畴 化 知觉 没有 本 质 影响 ， 或 许 因为 他 所 采用 的 被 试 是 “ 零 起 点 “的 汉语 学 习 者 ， 我 们 扒 


测 ， 这 种 音 高 模式 有 可 能 在 学 习 者 的 二 语 水 平 达 到 一 定 水 平 才能 够 产生 作用 。 于 谦 〈2016 ) 
和 本 文 作者 正在 进行 的 对 中 国境 内 其 他 少数 民族 感知 普通 话 声调 感知 的 研究 也 发 现 , 声调 语 


言 母语 者 的 语言 经 验 及 其 从 小 学 习 普 通话 的 语言 环境 , 对 于 他 们 感知 普通 话 声调 是 有 帮助 的 。 
、 结 论 

本 文 的 感知 实验 分 析 结 果 表 明 , 具有 较 高 朝 汉 双语 程度 的 延边 朝鲜 族 大 学 生 对 普通 话 声 

调 的 感知 接近 或 达到 了 母语 者 的 水 平 。 除 了 T2-T3 组 以 外 ， 其 他 各 组 声调 对 立 的 感知 范畴 化 

程度 和 母语 者 差异 不 大 。 母 语 背景 和 较 高 的 双语 程度 有 可 能 是 延边 朝鲜 族 学 生 对 普通 话 声调 

感知 接近 或 达到 母语 者 水 平 的 制约 因素 ，T2-T3 的 低 范畴 化 感知 水 平 与 前 人 对 不 同 母 语 背 景 


普通 话 学 习 者 的 研究 结果 一 致 , 说 明 两 类 声调 在 语音 声学 特征 上 的 相似 性 有 可 能 导致 高 级 阶 
段 的 学 习 者 也 无 法 成 功 建立 接近 母语 者 的 感知 模式 。 
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An Investigation to the Putonghua tone perception by Yanbian Korean ethnic students 
Lu Yao, Li Yinghao, Kong Jiangping 
(Department of Chinese Language and Literature, Peking University/Renmin University of China 
Libraries, Beijing 100872; College of Foreign languages, Yanbian University, Yanji Jilin 133002; 
Center for Chinese Linguistics/Department of Chinese Language and Literature, Peking 
University, Beijing 100872) 


[Abstract]This paper aims at investigating the Putonghua tone perception by the Yanbian Korean 
ethnic students through identification and discrimination tasks. Results show that the Korean 
university students with nearly balanced Korean and Chinese bilingual competence have attained 
near-native like Putonghu tone perception compared with the Putonghua native counterparts. 
Except the T2-T3 continuum, they have attained the nearly-native perceptual categorization of the 
Putonghua tones in the other tone continuums. The paper contends that the nearly successful 


attainment for the categorical perception of the Putonghua tones can be attributed to the Yanbian 


Korean linguistic background and the balanced bilingual competence. The lack of T2-T3 
categorical perception resembles the previous results for the Putonghua learners with diversified 
linguistic backgrounds, which indicates that the phonetic similarity of the two tones constitutes a 
special difficulty for the Putonghua learners and even advanced learners are not able to establish 


the native-like categorical perception with this regard. 


[Key words]Putonghua tone, categorical perception, Yanbian Korean language, linguistic 


experience 


